Digitale Edition und Generierung von Forschungsdaten

Digitale Edition und Generierung von Forschungsdaten

Organisatoren
Matthias Thumser, Baltische Historische Kommission; Jürgen Warmbrunn, Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft, Marburg; Johann Gottfried Herder-Forschungsrat
Förderer
Herder-Institut für historische Ostmitteleuropaforschung – Institut der Leibniz-Gemeinschaft, Marburg
Ort
Marburg
Land
Deutschland
Fand statt
In Präsenz
Vom - Bis
03.11.2022 - 03.11.2022
Von
Jürgen Warmbrunn, Forschungsbibliothek, Herder-Institut für historische Ostmitteleuropaforschung, Marburg

Der gemeinsame Workshop der Baltischen Historischen Kommission, des Herder-Instituts für historische Ostmitteleuropaforschung und des Johann Gottfried Herder-Forschungsrats bildete zugleich das 7. Kooperationstreffen dieser Partner. Die Veranstaltung hatte es sich zum Ziel gesetzt, die Zusammenhänge zwischen digitalen Editionen und der Generierung und Zugänglichmachung von Forschungsdaten insbesondere im Kontext der Geschichtswissenschaften zu beleuchten. Dabei sollte explizit weniger die Kreation von Websites mit schönen, bunten Oberflächen im Vordergrund stehen als die gerade für wissenschaftliche Editionen unabdingbare Erzielung von Nachhaltigkeit und Verlässlichkeit. Konkreter Ausgangspunkt war die Edition des „Liv-, Est- und Kurländischen Urkundenbuches“, deren digitale Projektkomponente als ein Musterbeispiel dafür dienen kann, wie Editionstexte und wissenschaftliche Apparate durch Kodierungsverfahren sinnvoll verknüpft werden können.

Nach der Begrüßung der Teilnehmerinnen und Teilnehmer durch Jürgen Warmbrunn (Marburg) als Stellvertretenden Direktor des Herder-Instituts und einer knappen thematischen Einführung durch Mattias Thumser (Berlin) beschäftigte sich der erste Beitrag des Workshops dann auch folgerichtig mit dem für diese Edition verwandten Dokumentenformat zur Kodierung und zum Austausch von Texten, basierend auf XML. MARTINA GÖDEL (Kappeln) von der Firma textloop verdeutlichte in ihrem Beitrag, warum sich XML-TEI mittlerweile zu einem De-facto-Standard in den Geisteswissenschaften entwickelt hat und weshalb dieses Dokumentenformat insbesondere bei Editionsprojekten Anwendung findet. Entsprechend richtete sie ihr Augenmerk auch noch auf ein weiteres Projekt, nämlich das „Deutsche Textarchiv“ (DTA) der Berlin-Brandenburgischen Akademie der Wissenschaften. Auch hier wurde deutlich, dass XML-TEI in besonderer Weise geeignet ist, die Einhaltung der „FAIR Data Principles“ für digitale Editionen mit allen ihren Komponenten (ausgedrückt durch die Adjektive findable, accessible, interoperable, reusable) zu gewährleisten.

Inhaltlich konnte der Beitrag von MATTHIAS THUMSER (Berlin) von der Baltischen Historischen Kommission, der das digitale Teilprojekt der Edition des „Liv-, Est- und Kurländischen Urkundenbuches“ vorstellte, passgenau auf den vorangegangenen Ausführungen aufbauen. Nachdem er zunächst in aller Kürze die Geschichte dieses herausragenden, seit mehr als anderthalb Jahrhunderten betriebenen Editionsprojekts zum Baltikum geschildert hatte, beschrieb Thumser sehr anschaulich und praxisorientiert sein Konzept, mit dem er in enger Zusammenarbeit mit der Firma textloop sämtliche Bände des Werks als digitale Edition im open access zur Verfügung stellt. Ein erster Schritt war, von den Bänden PDF-Dateien mit durchsuchbaren, „schmutzigen“ Volltexten herzustellen, auf die über den OPAC der Bayerischen Staatsbibliothek zugegriffen werden kann. Auf dieser Basis wurden in einem zweiten Schritt hochwertige Forschungsdaten in Form von fehlerfreien (99,98 %) Volltexten generiert. Darauf folgt konsequenterweise der dritte Schritt, die optimierten Volltexte mit TEI-Codes strukturell zu erschließen, indem die verschiedenen Elemente der Edition ausgezeichnet werden: laufende Nummer, Kopftext, Datum, diplomatische Beschreibung, Editionstext, kritischer und Sachapparat, außerdem typographische Auszeichnungen (kursiv, gesperrt) und Schriftgrade. Das Teilprojekt steht kurz vor dem Abschluss. Die ersten in dieser Weise kodierten Dateien sind bereits über den Forschungsdatendienst OstData der BSB abrufbar.

Zu Beginn seines Beitrags zur digitalen Annotierung von Briefen in ihren Überlieferungs- und Annotationskontexten beschrieb ANDREAS KUCZERA (Gießen) zunächst die aus seiner Sicht klar abzugrenzenden drei Phasen der Digitalisierung von Quellen, beginnend mit der in den 2000er-Jahren verbreiteten Vollbilddigitalisierung sämtlicher Handschriften, welche die Briefe Hildegards von Bingen enthalten, auf die dann die Volltextdigitalisierung folgte. In der aktuellen dritten Phase liege das Schwergewicht auf den in den Volltexten vorhandenen Entitäten, die möglichst mit Hilfe von Normdaten zu annotieren seien und dadurch auch über die Grenzen einzelner Projekte recherchierbar würden. Die Komplexität der Darstellung von Beziehungen zwischen Entitäten (etwa Personen, Körperschaften und Orten) schilderte er dem Veranstaltungsort angemessen und sehr anschaulich unter Zuhilfenahme des „Königsberger Brückenproblems“ von Leonhard Euler, bevor er näher auf das DFG-Projekt zur Edition der Briefe Hildegard von Bingens einging. Für die Teilnehmerinnen und Teilnehmer des Workshops war der von Kuczera ermöglichte Blick in die „digitale Werkstatt“ des Editionsprojekts in Form der graphbasierten digitalen Editionsumgebung „Hildegraph“ sicherlich von genauso großem Interesse wie seine Beschäftigung mit Aspekten der Überlieferungsmodellierung, des text reuse oder der Angemessenheit von Annotationshierarchien in einem geisteswissenschaftlichen Editionsvorhaben.

ANNA-LENA KÖRFER (Marburg) gelang es in ihrem Beitrag, zwei auf den ersten Blick nicht in unmittelbarem Zusammenhang stehende Themenkomplexe – nämlich eine spätantike Briefedition und den Forschungsdatendienst OstData – in einen konkreten Bezug zu setzen, indem sie die Aspekte der Forschungsdaten in digitalen Editionen auf der einen Seite und deren Publikation in einem Forschungsdatendienst wie OstData auf der anderen Seite behandelte. Ihre Beispieledition „Cassiodor Variae III“ wurde von 2017 bis 2020 vom BMBF betreut und zielt auf die Validierung des Nutzungsverhaltens von Geisteswissenschaftler:innen bei der Arbeit an und mit digitalen Tools. In diesem auch nach dem Ende der Förderphase fortgeführten Vorhaben wurden eine Forschungsinfrastruktur zur Analyse des Texts entwickelt, einschlägige Projekte der Digital Humanities visitiert und Interviews mit einschlägigen Experten geführt. Körfers Analyse der Forschungsdaten, die in digitalen Editionsvorhaben entstehen können, leitete nahtlos zur Präsentation des Forschungsdatendienstes für die Ost-, Ostmittel- und Südosteuropaforschung OstData über, der die Speicherung, Veröffentlichung, Langzeitarchivierung sowie komplexe Suchmöglichkeiten von Forschungsdaten zum Ziel hat.

Den Abschluss des Workshops bildete die Präsentation von SIMON DONIG (Marburg) zur Nationalen Forschungsdateninfrastruktur (NFDI), in der er die Ziele, die Funktionsweise und die Rolle des Herder-Instituts vorstellte. Donig hob noch einmal die große Bedeutung hervor, die den Forschungsdaten seit einigen Jahren beigemessen wird, verschwieg aber auch nicht, dass der Aufbau entsprechender Infrastrukturen für das Forschungsdatenmanagement auf nationaler Ebene etwa in den Geisteswissenschaften gleichzeitig noch ein work in progress ist. Zur Veranschaulichung erläuterte er die Rolle des Herder-Instituts als Mitantragsteller beim NFDI4Memory, bei dem es zwei Aufgaben übernehmen wird: Zusammen mit dem Deutschen Museum München ist es für eine task area zur Datenqualität verantwortlich, wobei es seine Aktivitäten zur digitalen Quellenkritik ebenso einbringt wie seine kuratorische Expertise. Außerdem wird es mit der Bayerischen Staatsbibliothek ein eigenes Osteuropa-Cluster organisieren, das die vielfältige Landschaft von historisch arbeitenden Professuren und Instituten mit einem Osteuropaschwerpunkt adressieren soll. Ebenfalls beteiligt ist das Herder-Institut am NFDI4Culture.

Die Teilnehmerzahl des Workshops ermöglichte intensive Diskussionen wie auch die Beantwortung zahlreicher Fragen. Als Fazit der Veranstaltung kann eine Äußerung aus den Diskussionen dienen, wonach die Digital Humanities als solche keine Antworten auf Forschungsfragen liefern, aber aufzeigen, wo es sich lohnt, genauer hinzuschauen. Ebenso wurde der enge Bezug zwischen digitalen Editionen und dem Forschungsdatenmanagement sehr klar herausgearbeitet und deutlich gemacht, dass dem Umgang mit Forschungsdaten auch in den Geschichtswissenschaften in den kommenden Jahren eine immer größere Rolle zukommen werde.

Konferenzübersicht:

Jürgen Warmbrunn (Marburg): Begrüßung

Matthias Thumser (Berlin): Thematische Einleitung

Martina Gödel (Kappeln): XML-TEI in der Praxis

Matthias Thumser (Berlin): Liv-, Est- und Kurländisches Urkundenbuch, das digitale Teilprojekt

Andreas Kuczera (Gießen): Vernetzte Wissensgrundlagen – Die Regesta Imperii im 21. Jahrhundert

Anna-Lena Körfer (Marburg): Forschungsdaten in digitalen Editionen: Das Beispiel einer spätantiken Briefedition und des Forschungsdatendienstes OstData

Simon Donig (Marburg): Nationale Forschungsdateninfrastruktur – Ziele, Funktionsweise, Rolle des Herder-Instituts

Redaktion
Veröffentlicht am
Klassifikation
Weitere Informationen
Land Veranstaltung
Sprache(n) der Konferenz
Deutsch
Sprache des Berichts